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基于 智能 手机 传感器 的 基础 行为 识别 方法 研究 
IL S, WWE, XE, E—E 
(战略 支援 部 队 信息 工程 大 学 密码 工程 学 院 ， 郑 州 450001) 


摘 要 : 为 提高 人 类 行为 识别 准确 性 的 同时 降低 实现 过 程 的 复杂 程度 ， 提 出 基于 智能 手机 加 速度 传感器 与 陀螺 仪 数 
据 对 六 种 日 常 基础 行为 进行 识别 的 方法 。 在 分 析 传感器 框架 的 基础 上 ， 对 加 速度 传感器 进行 数据 采集 并 对 原始 数据 
进行 数据 预 处 理 ， 然 后 采用 主 成 分 分 析 方 法 结合 已 有 知识 对 数据 统计 特征 进行 降低 维 数 处 理 ， 再 利用 机 器 学 习 算法 
实现 对 行为 特征 的 分 类 与 识别 ， 目 的 是 简化 基础 行为 的 识别 过 程 并 提高 数据 的 利用 率 。 实 验 测试 结果 验证 了 决策 树 
与 支持 向 量 机 分 类 器 结合 使 用 的 有 效 性 ， 识 别 准 确 率 可 接近 97%。 
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Basis behavior recognition based on sensors in smartphone 


Kong Jing, Guo Yuanbo, Liu Chunhui, Wang Yifeng 
(Cryptography Engineering Institute, PLA Information Engineering University, Zhengzhou 450001, China) 


Abstract: To improve the accuracy of human behavior recognition and reduce the complexity of the implementation 
process, this paper raises a method using the data of acceleration sensor and gyroscope in smartphone to recognize six kinds 
of daily basic behaviors. Data of acceleration sensor are collected and preprocessed after analyzing the framework of sensor, 
then principal component analysis method combining with existing knowledge are used to reduce the dimension of the 
statistical characteristics of the original data. Then machine learning algorithms are used to classify and recognize the 
behavioral characteristics, which aimed at simplifying the basic behavior recognition process and improving the utilization 
rate of the data. The experimental result shows that the combination of decision tree and support vector machine classifier is 
effectual, and the recognition accuracy can be close to 97%. 

Key words: smart phone sensors; basic behaviors; principal component snalysis; decision tree; support vector machine 
classifier 


0 引言 应 用 也 对 无 线 物 联网 领域 的 发 展 起 到 良好 的 促进 作用 。 
A 智能 手机 的 普及 意味 着 用 户 时 刻 携带 一 台 小 型 计算 机 ， 

人 类 行为 识别 (human activity recognition，HAR) 利 用 外 ”这 使 得 智能 手机 可 当 作 可 穿戴 设备 的 计算 中 枢 。 利 用 智能 手 

界 数据 对 动作 类 型 、 行 为 模式 进行 识别 和 分 析 ， 是 计算 机 检 ”机 内 置 传感器 对 基础 行为 进行 研究 与 探索 在 现 如 今 变 得 越 来 
测 和 理解 人 类 运动 和 行为 的 主要 方法 ， 可 用 于 对 特殊 行为 的 越 有 意义 ， 利 用 新 型 算法 并 根据 时 代 需 求 不 断 更 新 、 优 化 、 
检测 或 监察 趾 。 早期 行为 识别 研究 主要 利用 的 是 可 穿戴 设备 ， 改善 ， 可 以 提出 更 好 的 思路 并 开拓 更 广阔 的 应 用 市 场 。Lee 
将 具有 记录 功能 的 运动 传感器 固定 在 身体 特定 部 位 ， 数 据 采 等 人 外 利用 加 速度 传感器 对 活动 进行 识别 的 同时 考虑 到 手机 
集 过 程 对 工作 生活 造成 很 大 影响 ， 不 宜 于 推广 和 使 用 。 智 能 ” 存储 空间 和 计算 能 力 的 问题 ， 设 计 了 分 层 识别 的 系统 ， 先 通 
手机 作为 畅销 移动 通信 设备 ， 其 越 来 越 完善 的 功能 在 提供 便 。 过 第 一 层 隐 马尔 可 夫 模 型 (hidden Markova model, HMM) 对 活 
捷 的 同时 传感器 硬件 快速 更 新 换代 对 行为 识别 研究 而 言 使 得 动 的 时 间 序 列 进行 识别 ， 再 通过 层 隐 马尔 可 夫 模 型 识别 
动 监察 和 监控 日 常生 活 行为 有 了 实现 的 可 能 外 。 基 于 智能 — 用 户 的 具体 活动 ， 实 现 难度 较 大 的 同时 空间 开销 较 大 。Yan 
手机 传感器 的 行为 识别 研究 成 果 已 在 多 领域 应 用 。 与 可 穿戴 “等 人 喇 在 手机 资源 消耗 小 、 识 别 准确 率 高 的 前 提 下 提出 了 
设备 相 比 , 基于 智能 手机 传感器 的 行为 识别 现实 意义 更 强 Bg。 — ASR 模型 ， 该 模型 是 基于 传感器 自 适 应 的 活动 识别 模型 ， 可 
基础 行为 识别 的 研究 意义 重大 ， 是 复杂 行为 识别 、 运 动 ”识别 一 系列 的 连续 简单 活动 。Zhang 等 人 [9 利用 手机 加 速度 
方式 分 析 的 基础 。 由 于 基础 行为 具有 不 可 再 分 的 原子 性 ， 内 传感器 数据 离线 识别 人 体 小 幅度 和 部 分 剧烈 活动 ， 将 活动 进 
容 丰 富 的 行为 均 是 基础 行为 的 组 合 与 衍生 ， 准 确 识 别 基础 行 行 分 级 分 类 ， 先 识别 是 否 是 静止 ， 再 进行 后 续 具 体 活动 分 识 
为 并 综合 考虑 时 间 空 间 开 销 是 后 续 研究 的 前 提 。 基 础 行为 识 。 别 。 这 种 方法 主要 是 利用 离线 数据 集 进行 实验 与 测试 ， 缺 乏 
别 所 选用 的 数据 处 理 与 分 类 算法 对 后 续 日 常 行 为 识别 研究 内 行为 识别 的 实时 性 。Lu 等 人 中 设计 提出 了 Jigsaw 系统 用 于 手 
容 有 着 重要 的 借鉴 意义 。 利 用 智能 手机 传感器 对 基础 行为 识 几 多 传感器 数据 的 行为 识别 ， 这 些 传感器 先 分 别 利用 自身 采 
别 进行 研究 与 探索 从 实际 应 用 角度 来 讲 是 计算 机 研究 内 容 的 ” 和 集 的 数据 先进 行 分 类 ， 再 将 结果 相 结 合 分 析 ， 确 定 用 户 最 终 
重要 部 分 ， 行 为 识别 研究 成 果 在 智能 传 感 感知 系统 中 的 广泛 。 行为。 这 种 分 开 在 结合 的 研究 方式 是 现今 比较 流行 的 识别 方 
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法 。 由 于 行为 通常 是 上 下 文 相关 的 ，Do 等 人 外 利用 多 个 传 感 基础 行为 识别 过 程 主要 包括 数据 降 维和 数据 分 类 两 部 分 


器 数据 应 用 上 下 文 模型 对 人 类 行为 进行 识别 ， 根 据 模 型 特征 设计 。 其 中 ， 主 成 分 分 析 (principal component analysis, PCA) 
提取 不 同 运动 模式 ， 用 概率 统计 方法 将 这 些 模型 结合 用 于 最 是 数据 压缩 效果 较 好 的 算法 。 主 成 分 分 析 方 法 对 新 主 元 素 向 
EHEJ 


后 的 活动 识别 。 智 能 手机 使 用 信息 亦 可 反映 用 户 的 行为 信息 。 量 按 照 重 要 性 进行 排序 ， 根 据 需 要 自前 向 后 取 所 需 的 重要 部 
中 ,如 其 中 特定 功能 的 使 用 次 数 、 应 用 程序 中 的 反馈 信息 等 。 ”分 并 将 后 面 的 维 数 省 去 ， 从 而 达到 对 数据 维度 进行 压缩 的 效 
综 上 可 见 ， 在 手机 环境 下 进行 数据 处 理 需 要 综合 考虑 算法 实 。 果 ， 同 时 最 大 程度 保持 了 原 有 数据 信息 。 其 最 大 优点 是 过 程 
现 难度 和 资源 利用 等 问题 ， 要 尽 可 能 地 避免 对 手机 正常 使 用 ”中 完全 无 参数 限制 ， 计 算 时 不 需要 人 为 设 定 参数 或 根据 已 有 
造成 影响 。 研究 经 验 进 行 干预 ， 最 后 得 到 的 结果 只 与 原始 数据 相关 ， 与 

已 有 利用 智能 手机 传感器 的 研究 中 对 静止 、 缓 慢 行动 、 人 为 主观 条 件 无 关 。 对 于 基础 行为 识别 过 程 中 应 用 的 特征 选 


剧烈 运动 三 种 行为 状态 的 识别 颇具 代表 性 ， 可 基本 概括 出 用 ” 择 而 言 ， 主 成 分 分 析 的 优点 可 满足 数据 训练 需求 ， 故 本 文 首 
户 正 常 的 生活 状态 。 本 文 根 据 在 真实 场景 中 不 同行 为 在 日 常 。 先 选用 主 成 分 分 析 方 法 对 数据 特征 进行 压缩 ， 减 少 人 工 选择 
生活 中 发 生 概率 的 不 同 将 这 三 种 状态 具体 化 为 六 种 日 常 基础 。 的 工作 量 。 由 于 手机 传感器 产生 的 数据 是 依据 时 间 序列 的 ， 
行为 : 站 立 、 坐 、 平 身 、 步 行 (水 平 )、 上 行 (步行 上 楼 梯 ) 和 下 ”具有 连续 、 局 部 相关 性 高 的 特点 ， 最 后 选择 出 实验 所 用 的 数 
行 (步行 下 楼 梯 )， 提 出 了 基于 智能 手机 传感器 数据 对 基础 行 。”” 据 特 征 多 为 时 序 特征 。 
为 进行 识别 的 方法 。 由 于 剧烈 运动 在 日 常生 活 中 发 生 频率 不 现 有 行为 识别 过 程 中 所 选用 得 而 分 类 方法 多 是 单一 分 类 
高 ， 所 以 没有 具体 细 化 。 该 方法 首先 对 加 速度 传感器 和 陀螺 算法 ， 但 在 实际 解决 问题 时 单一 的 分 类 器 无 法 满足 高 精度 识 
仪 在 X、Y、Z 轴 三 个 方向 多 个 原始 数据 统计 特征 结合 已 有 知 。 别 的 需求 ， 多 种 类 分 类 器 的 集成 使 用 在 性 能 和 效率 方面 都 要 
识 进行 提取 ， 再 利用 决策 树 和 支持 向 量 机 分 类 器 相互 结合 的 。” 优 于 单一 分 类 器 的 应 用 。 根 据 对 选 定 行为 特征 的 分 析 ， 首 先 
方法 进行 行为 分 类 识别 。 将 本 文 六 种 行为 的 识别 过 程 描述 为 多 次 二 分 类 问题 ， 决 策 树 
1 ”基本 思 和 支持 向 量 机 分 类 器 在 二 分 类 问题 的 处 理 中 均 具有 易于 实 
见 、 训 练 数 据 量 小 和 分 类 准确 度 高 的 特点 UU， 结合 使 用 还 可 
基于 智能 手机 传感器 数据 的 基础 行为 识别 通用 过 程 包括 ”以 避免 过 拟 合 等 情况 的 发 生 ， 故 本 文 实验 选择 在 决策 树 的 树 
传感器 数据 采集 、 数据 处 理 、 特征 提 取 和 分 类 识别 四 个 模块 ， ”节点 处 对 支持 向 量 机 进行 训练 ， 将 两 分 类 器 的 优点 融合 ， 提 
如 图 1 所 示 。 首 先 选择 代表 性 强 的 志愿 者 对 多 传感器 进行 的 。 ”高 数据 的 利用 率 并 改进 了 识别 的 效率 。 
数据 采集 ,将 加 速度 传感器 数据 单独 分 离 出 来 用 于 本 文 实验 ; 基于 上 述 思 想 ， 本 文 首先 利用 主 成 分 分 析 和 人 工 干 预 的 
然后 对 原始 数据 进行 数据 预 处 理 ， 去 除 不 可 用 和 不 平稳 阶段 。 方法 对 数据 特征 进行 降 维 处 理 ， 对 实验 中 训练 和 测试 所 需要 
的 数据 以 保证 数据 质量 ， 接 下 来 利用 数据 降 维 技术 和 已 有 物 ”的 数据 特征 进行 约 简 并 得 到 最 优 特征 子 集 ， 再 利用 决策 树 与 
理 常识 以 及 数据 统计 知识 对 数据 特征 进行 选择 与 提取 并 对 分 。 支持 向 量 机 集成 的 分 类 器 完成 对 日 常 基础 行为 的 识别 。 
类 器 进行 训练 ， 完 成 行为 识别 分 类 器 的 训练 阶段 。 2 ”行为 识别 
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数据 采集 一 行为 识别 过 程 中 所 选 分 类 器 性 能 的 好 坏 直接 影响 最 后 识 

别 的 效果 ; 同时 用 于 分 类 的 数据 特征 的 质量 对 分 类 结果 也 有 

| 着 不 可 忽略 的 作用 。 一 般 来 说 ， 每 个 行为 可 越 清 晰 的 在 特征 

: 特征 提取 空间 与 其 他 行为 的 特征 分 离 出 来 识别 性 能 就 会 越 好 。 理想 情 

分 类 识别 O stR 况 下 ， 相 同行 为 的 特征 在 特征 空间 相同 位 置 聚 集 ， 不 同行 为 

的 特征 则 相距 甚 远 。 同 时 ， 好 的 行为 识别 特征 可 以 在 不 同 个 

MI 行为 识别 通用 流 各 体 及 相同 行为 组 内 有 变异 时 体现 出 足够 的 鲁 棒 性 。 本 节 将 对 

Fig. 1 Generic flowchart for behavior identification 数据 降 维 方法 即 特征 选择 技术 和 行为 识别 分 类 器 进行 详细 介 
于 数据 质量 直接 影响 识别 结果 no， 数 据 处 理工 作为 实 M 


验 中 的 重要 组 成 部 分 。 图 2 展示 了 由 原始 数据 到 最 后 实验 数 21 基于 主 成 分 分 析 的 数据 降 维 


据 的 数据 信息 流 。 行为 识别 领域 公认 可 用 特征 有 很 多 ， 本 节 处 理 对 象 是 数 
原始 数据 测试 据 的 统计 特征 。 这 些 特征 主要 依靠 计算 ^E, 如 极 大 极 小 值 、 

均值 、 方 差 、 标 准 差 、 百 分 位 数值 、 炉 、 能 量 、 峰 度 系数 、 

[mem 平均 绝对 偏差 、 轴 相关 性 、 和 斜率 、 曲 率 等 ， 因 获取 简单 且 分 

纯 数据 | — — —5| sica | 5 IL 类 性 能 好 在 行为 识别 领域 应 用 广泛 。 特 征 空间 维 数 越 高 ， 对 

数据 降 维 计算 密集 型 分 类 问题 而 言 所 需 训练 时 间 和 数据 就 越 多 。 因 此 ， 

图 2 数据 信息 流向 这 部 分 工作 的 目的 是 保证 实验 中 应 用 最 少 的 特征 且 分 类 可 达 


Fig.2 Data information flow 到 目标 效果 。 人 工 参与 昌 必 不 可 少 ， 但 手动 选择 全 部 特征 过 

原始 数据 首先 要 经 过 数据 预 处 理 ， 将 其 中 噪声 等 不 可 用 ”于 繁琐 , 故 首 先 使 用 特征 自动 排序 和 选择 方法 进行 初步 筛选 ， 

的 数据 去 除 ， 从 而 得 到 相对 于 原始 数据 而 言 的 “ 纯 数据 ” 然 再 利用 物理 知识 进行 人 为 补充 。 
后 对 多 种 数据 特征 进行 降 维 处 理 , 提取 出 20 余 种 特征 用 于 描 在 统计 学 中 主 成 分 分 析 是 一 种 简化 数据 集 的 常用 技术 ， 
述 每 种 行为 ， 这 些 特 征 包括 常规 的 极 大 极 小 值 、 均 值 、 标 准 ” 旨 在 利用 降 维 思想 把 多 维 指标 转换 为 少数 综合 指标 ， 是 一 个 
差 、 相 关 性 系数 、 信 号 幅度 区 、 自 回归 系数 等 常见 数理 统计 线性 变换 。 这 个 变换 把 数据 转换 到 新 坐标 系 中 ， 使 得 原始 数 
特征 ， 也 包含 频段 能 量 、 频 偏 、 向 量 间 角 度 等 不 常见 的 其 他 ” 据 投影 的 第 一 大 方差 在 第 一 个 坐标 ( 称 为 第 一 主 成 分 ) 上 ， 第 
领域 特征 ， 经 此 过 程 最 后 得 到 的 数据 可 直接 集成 用 于 训练 和 大 方差 在 第 二 个 坐标 (第 二 主 成 分 上 ， 依 次 类 推 。 该 变换 
测试 的 数据 集 。 过 程 通过 保留 低 阶 主 成 分 忽略 高 阶 主 成 分 的 方法 在 减少 数 维 
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数 的 同时 保持 对 方差 贡献 最 大 的 特征 ， 这 样 低 
够 保留 数据 重要 方面 的 信息 。 
主 成 分 分 析 是 为 了 克服 最 小 二 乘法 估计 在 数据 矩阵 存在 
多 重 共 线 时 表现 出 的 不 稳定 性 而 提出 来 的 ， 其 主要 思想 是 依 
据 数据 寻找 一 个 主轴 方向 ， 再 依据 这 个 主轴 构建 新 坐标 系 ， 
维 数 比 原 维 数 降低 ， 将 数据 由 原 坐 标 系 向 新 坐标 系 投影 ， 投 
影 过 程 即 数据 降 维 的 过 程 ， 使 得 到 的 新 变量 带 有 独特 的 代表 
含义 。 主 成 分 分 析 方法 的 过 程 ， 实 际 上 是 一 个 构造 转换 矩阵 
的 过 程 。 以 下 将 对 主 成 分 分 析 方 法 的 具体 实现 步骤 进行 具体 
说 明 。 

1) 对 原始 数据 特征 进行 标准 化 计算 。 

设 指标 变量 共有 mT, DAX xis xi ss Xm KA n 
个 对 象 ， 第 i 个 对 象 的 第 j 个 指标 的 取 值 为 az。 将 各 指标 转 
换 成 标准 化 标 值 ， 有 


3 
E 
xd 
> 
BE 


di — Hi 


E ams (1) 
EL 中 i-L2 n , j=1,2,…,m , m=} E 3 
sy = -my ， 即 25. sg 2928 j 个 指标 的 样本 均值 和 
样本 标准 差 。 
你 斑 = -生生 ， j=12,…,m 为 标准 化 指标 变量 。 


2) RIR RERE R= Omn, A 
NOTICE" Q) 
e n-1 
其 中 : nl, "u-njdkW TB ARR 
3) 计算 特征 值 与 特征 向 量 。 首先 计算 相关 系数 矩阵 R 的 
特征 值 和 > 即 >…> 入 >0， 及 对 应 的 特征 向 量 4845s, HER 
uj 7 Ut pos ， 寺 征 向 量 组 成 m 个 新 的 指标 变量 ， 
Yi = Ha to + Wh, 
Ya 7 HX, + Why tt ial, 


(3) 


yn 7 WT + ouo T e Lu, 
其 中 : yj 是 第 一 个 主 成 分 ，y2 是 第 二 个 主 成 分 ， 依 此 类 推 。 
4) 选择 p(p<m) 个 主 成 分 ， 并 分 别 计算 主 成 分 的 贡献 率 
及 累计 贡献 率 。 即 计算 特征 值 4 的 信息 贡献 紊 和 累计 贡献 
K. ERD y; 的 信息 贡献 率 式 4), ERI Ye sev» 的 累计 贡 
献 率 式 (5) 分 别 为 


b-—. j-l2,m 
j À. (4) 
k=l 
e ah 
BECA (5) 
ka k 


25a, 接近 1 时 (一 般 取 值 为 0.85，0.9，0.95 等 )， 则 选择 
的 m 个 指标 变量 ， 从 而 可 对 p 个 主 成 分 进行 综合 分 析 。 
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2.2 基于 决策 树 的 数据 分 类 

决策 树 (decision tree) 算 法 是 对 基础 行为 的 识别 研究 中 应 
用 广泛 的 分 类 算法 {中 ， 其 结构 类 似 于 流程 图 的 树 状 结构 ， 通 
过 训练 数据 构建 决策 树 ， 可 对 未 知 数据 进行 高 效 的 分 类 。 决 
策 树 得 而 核心 思想 首先 是 在 数据 集中 找到 一 个 最 优 特征 ; 然 
后 从 该 特征 的 选 值 中 再 找 出 一 个 最 优 候选 值 ， 根 据 这 个 最 优 
候选 值 将 目标 数据 集 分 成 两 个 子 数据 集 ; 最 后 不 断 递归 上 述 
操作 ， 直 到 满足 指定 条 件 即 为 结束 。 其 中 最 顶层 节点 为 根 节 
点 ， 每 个 非 树叶 节点 表示 针对 某 一 个 特征 值 的 测试 ， 每 个 分 
支 表示 相应 特征 值 的 测试 输出 ， 每 个 树叶 节点 则 表示 从 根 节 
点 到 该 树叶 节点 的 路 径 所 表示 对 象 的 类 别 。 

采用 决策 树 算法 的 基本 方法 就 是 首先 利用 训练 样本 构建 
决策 树 , 然后 将 待 测 样本 的 特征 向 量 从 该 决策 树 根 节点 出 发 ， 
按照 相应 特征 值 的 测试 输出 , 沿 着 决策 树 一 直到 达 树 叶 节 点 ， 
便 获得 该 样本 的 最 终 分 类 结果 ; 而 在 二 类 分 类 模型 中 支持 向 
量 机 分 类 器 在 小 样本 、 非 线性 模式 识别 中 优势 很 剖 ， 适 用 于 
处 理 加 速度 传感器 数据 。 决 策 树 有 支持 向 量 机 的 结合 使 用 可 
以 增强 分 类 效果 并 降低 空间 和 时 间 开 销 。 
决策 树 即 二 又 树 。 其 主要 优点 在 于 : 生成 的 规则 可 理解 
性 强 ， 训 练 过 程 有 普 适 性 ;对 计算 量 的 要 求 相对 来 较 小 ， 符 
合 传感器 数据 集 规模 ， 在 处 理 连续 种 类 字段 时 性 能 较 好 ， 契 
合 传感器 数据 的 数据 特征 ， 可 显示 出 重要 信息 字段 ， 是 性 能 
较 好 的 二 分 类 算法 。 而 作为 二 类 分 类 模型 的 另 一 种 算法 支持 
向 量 机 分 类 器 在 小 样本 数据 集 、 非 线性 模式 识别 中 优势 很 强 ; 
多 分 类 问题 可 转换 为 多 个 二 分 类 问题 进行 解决 。 本 文 综合 两 
种 分 类 算法 优点 ， 采 用 决策 树 与 支持 向 量 机 结合 使 用 的 方法 
实现 对 六 种 基础 行为 的 多 分 类 识别 。 具 体 方 法 为 在 决策 树 各 
节点 处 对 支持 向 量 机 分 类 器 进行 训练 ， 再 对 其 进行 样本 识别 
和 分 类 的 测试 。 首 先 构建 决策 树 分 为 以 下 两 步 : 

a) 决 策 树 的 生成 。 利 用 经 过 多 层 预 处 理 的 传感器 训练 样 
本 数据 集 生 成 对 应 的 决策 树 。 训 练 样本 数据 集 要 根据 实际 需 
求 由 有 一 定 综合 程度 、 已 准确 分 类 的 数据 组 成 ， 用 于 分 析 处 
里 后 集成 的 数据 集 。 本 实验 训练 数据 集 包 含 完 全 分 类 好 的 正 
向 数据 ， 满 足 实验 中 准确 生成 分 类 决策 树 的 需求 。 

b) 决 策 树 的 剪 技 。 决 策 树 的 剪 枝 是 对 决策 树 结构 合理 性 
的 检验 与 校正 ， 并 对 下 一 阶段 的 修正 过 程 ， 主 要 用 于 测试 数 
据 集中 的 数据 对 决策 树 生成 过 程 中 产生 的 初步 规则 进行 校 
对 ， 将 部 分 影响 准确 性 或 对 准确 性 无 用 的 分 枝 剪除 。 这 一 步 
又 结合 常用 物理 知识 选择 处 合适 且 少 量 的 数据 特征 用 于 描述 
两 种 行为 之 间 的 区 别 。 

结合 决策 树 分 类 方法 和 支持 向 量 机 分 类 器 ， 多 步 又 的 二 
分 类 进行 如 图 3 所 示 。 


Mea 


5) 计算 综合 得 分 。bj 综 合 得 分 为 第 j 个 主 成 分 的 信息 贡 
献 率 ， 根 据 综合 得 分 即 可 评价 。 综 合 得 分 计算 方法 为 
Z =), by (6) 
综 上 可 见 ， 主 成 分 分 析 方法 将 原 有 传感器 数据 特征 变换 
成 男 一 组 数据 特征 ， 即 得 到 原始 数据 集 的 主 成 分 ， 选 择 其 中 
部 分 重要 的 主 成 分 作为 新 的 自 变 量 ， 丢 弃 了 其 他 影响 不 大 的 
部 分 自 变 量 ， 实 际 上 达到 了 对 数据 特征 降 维 目的 。 


&| [x E 


图 3 决策 树 与 支持 向 量 机 结合 分 类 方法 


Fig. 4 Decision tree is combined with support vector machine for 


classification 
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分 类 时 特征 值 的 选取 对 使 用 二 叉 树 思想 进行 行为 识别 至 间 数 组 ， 然 后 通过 简单 的 差 值 计算 得 到 相对 应 的 频率 数组 ，; 
关 重 要 ， 通 过 前 一 步骤 的 分 析 与 提取 后 在 分 类 前 仍 需 对 处 理 最 后 计算 频率 数组 的 均值 。 
后 的 特征 进行 人 工 筛选 加 以 详细 分 析 ， 提 取出 针对 每 对 行为 AHA 
不 同 的 特征 值 ， 提 高 分 类 效率 的 同时 降低 时 间 空 间 开销 。 3 ”实验 与 结果 分 析 
1) 静止 与 其 他 。 静止 与 步行 、 上 行 和 下 行 其 他 类 行为 在 。” 3.1 实验 数据 集 
数据 特征 上 较为 明显 。 当 用 户 处 于 静止 状态 时 加 速度 传感器 前 Android, IOS 或 黑 侮 等 市 场 上 常见 的 智能 手机 系统 
的 变化 量 极 小 到 可 忽略 ， 数 据 波 动 也 较 小 ， 当 用 户 携手 机 步 上 均 没 有 对 无 须 许可 的 传感器 进行 特殊 管理 或 保护 其 数据 信 
行 、 上 行 、 下 行 或 进行 剧烈 活动 时 ， 加 速度 传感器 变化 幅度 息 流 的 管理 控制 机 制 ， 即 任意 应 用 程序 都 可 通过 访问 传感器 
数据 波动 都 很 大 。 通 过 对 采集 到 的 加 速度 传感器 原始 数据 的 应 用 程序 接口 从 而 访问 所 有 无 须 许可 的 传感器 并 获取 其 数 
分 析 后 决定 对 选择 加 速度 传感器 三 轴 合 成 的 加 速度 进行 特征 据 ， 这 亦 是 本 实验 数据 采集 框架 的 理论 基础 。 
选择 ， 将 其 在 三 个 方向 上 的 均值 、 方 差 作 为 特征 值 ， 以 区 分 智能 手机 传感器 应 用 程序 接口 是 一 组 定义 程序 及 协议 的 
静止 和 其 他 。 有 具体 分 为 两 步 进行 : 首先 由 加 速度 传感器 在 三 集合 ， 通 过 该 接口 实现 应 用 程序 与 应 用 程序 、 应 用 程序 与 传 
个 方向 上 的 数据 av ay, a: 得 到 合成 加 速度 ， 然 后 计算 合成 感 器 硬件 、 传 感 器 硬件 与 传感器 硬件 之 间 的 相互 通信 ， 其 主 
加 速度 的 均值 、 方 差 等 特征 值 。 其 合成 加 速度 为 要 功能 是 提供 通用 功能 集 ， 为 应 用 程序 开发 人 员 提 供 可 以 访 
INIRE MERE 问 的 一 组 例 程 031， 而 又 无 须 访问 源码 或 理解 内 部 工作 机 制 的 
人 O 。 细节， 这样 程 序 开发 人 员 在 开发 应 用 程序 时 可 通过 调用 应 用 
2) 水 平静 止 与 竖 直 静止 。 因为 手机 屏幕 朝向 会 影响 重力 程序 接口 提供 的 函数 直接 对 应 用 程序 进行 开发 ， 减 轻 了 研发 
加 速度 的 分 布 ， 区 分 这 两 个 行为 较为 容易 。 手 机 屏幕 朝 上 平 过 程 中 的 编程 任务 。 应 用 程序 接口 同时 也 是 一 种 中 间 件 ， 为 
放 时 , X 轴 默 认为 0， 了 轴 默 认 0, Z 轴 默 认 +9.81; 手机 屏幕 各 种 不 同 的 平台 提供 数据 共享 功能 。 
竖 直 向 前 或 后 时 , X 轴 默 认为 0, 了 轴 默 认 +9.81, Z 轴 默 认 0; 本 文 实验 在 Android 系统 智能 手机 上 完成 ， 数 据 采集 和 
手机 屏幕 水 平 向 前 或 后 时 , XX 轴 上 默认 为 +9.81, 了 轴 默 认 0，Z 数据 处 理 方法 经 适当 地 调整 可 推广 到 其 他 型 号 和 系统 的 智能 
轴 默 认 0。 实 验 时 该 过 程 比 较 X、 芭 Z 三 个 方向 上 加 速度 数 手机 上 。 在 数据 采集 阶段 首先 利用 Android 智能 手机 内 部 传 
值 的 大 小 ， 通 过 分 析 最 大 值 所 属 坐 标 轴 即 可 完成 分 类 。 感 器 组 织 框架 集成 了 一 个 小 型 应 用 程序 用 于 获取 实验 所 需 的 
3) 站 立 与 坐 。 站 与 坐 的 区 分 是 已 有 基础 行为 识别 研究 中 无 许可 传感器 数据 。 为 方便 后 续 实验 中 数据 导出 ， 首 先 将 存 
较 难 区 分 的 两 个 行为 , 平均 识别 率 在 85%~90%。 由 于 大 多 数 储 卡 的 数据 读 写 权限 授予 该 应 用 程序 ， 然 后 导入 可 处 理 监 听 
用 户 在 静坐 时 上 半身 保持 挺 直 ， 与 站 立时 在 形体 姿态 上 无 明 事件 的 硬件 监听 , 同时 对 实验 用 到 的 传感器 逐一 注册 监听 器 ; 
显 差别 ， 智 能 手机 中 加 速度 传感器 与 陀螺 仪 类 似 的 无 须 许 可 最 后 利用 Android 调试 工具 生成 APK(Android package, 
的 传感器 无 法 判断 所 处 高 度 ， 在 数据 特征 表示 方面 几乎 下 相 Android 应 用 程序 安装 包 )， 导 入 手机 安装 成 功 后 在 开启 状态 
同 。 在 进行 这 两 种 行为 的 数据 采集 过 程 是 发 现 由 于 坐 下 时 腿 下 即 可 监听 传感器 产生 的 数据 并 写 入 指定 列表 。 
部 和 跨 的 弯曲 和 移动 会 导致 陀螺 仪 Z 轴 的 数据 发 生 轻 微 变 前 的 手机 应 用 程序 分 为 系统 应 用 程序 和 非 系 统 应 用 程 
化 ， 故 选择 Z 轴 方 向 数据 的 变化 情况 作为 区 分 站 与 坐 的 数据 序 ， 其 中 系统 应 用 程序 由 生产 商 设置 ， 在 手机 出 广 时 已 完 
特征 。 安装 ,通常 情况 下 用 户 在 购买 后 使 用 时 无 法 卸载 或 修改 权限 。 
4) 步行 与 其 他 。 步行 和 上 行 、 下 行 的 数据 特征 在 极 大 极 而 非 系统 应 用 程序 在 安装 时 首先 通过 开发 工具 包 向 应 用 程序 
小 值 、 均 值 、 方 差 、 频 率 等 方面 均 无 显 车 区别。 根据 对 原始 接口 平台 发 送 访问 某 个 传感器 的 请 求 ， 然 后 将 应 用 程序 注册 
数据 的 观察 ， 步 行 时 由 于 未 克服 重力 做 功 数 据 样本 在 Z 轴 方 到 相应 的 传感器 。 如 果 多 个 应 用 程序 同时 尝试 注册 相同 的 传 
司 与 9.81 很 接近 , 而 上 下 行 的 样本 数据 在 Z 轴 上 的 加 速度 数 感 器 ， 应 用 程序 接口 平台 会 运行 多 路 复 用 程序 ， 使 不 同 应 
据 幅 值 ( 极 大 值 减 去 极 小 值 ) 比 步行 波动 要 大 ， 可 把 此 特征 值 程序 可 在 同一 个 传感器 中 同时 注册 。 硬 件 抽 象 层 (hardware 
用 来 区 分 步行 和 上 行 。 abstract layer，HAL) 是 系统 内 的 接口 ， 将 传感器 硬件 与 系统 
具体 分 为 三 步 进行 ， 首先 遍历 数据 样本 ， 输 出 短 时 间 内 的 设备 驱动 程序 相互 绑 定 。 硬 件 抽象 层 具体 由 Sensors.h 和 
极 大 值 数组 和 极 小 值 数组 ， 然 后 通过 利用 极 大 极 小 值 数组 计 Sensors.cpp 两 部 分 组 成 。Sensors.h 是 硬件 抽象 层 的 接口 ， 
算得 到 幅 值 数组 ， 最 后 对 幅 值 数据 求 均值 和 方差 。 Sensors.cpp 为 硬件 抽象 层 实现 具体 指令 的 工作 。 
5) 上 行 与 下 行 。 上 行 与 步行 在 数据 特征 上 较 接 近 。 上 行 通过 硬件 抽象 层 的 本 机 库 ， 不 同 的 应 用 程序 可 以 与 底层 
时 由 于 重力 做 负 功 消耗 能 量 较 多 ， 跨 步 的 动作 频次 普遍 会 降 的 Linux 内 核 通 信 , 读 取 和 写 入 与 制定 的 传感器 相关 的 文件 。 
低 ; 相反 ， 下 行 时 重力 做 正 功 ， 动 作 相 对 较 轻 松 ， 动 作 频 次 目前 对 于 大 多 数 传感器 而 言 访问 这 些 文件 不 需要 任何 权限 。 
普遍 较 快 ， 每 两 步 之 间 的 停留 时 间 会 变 短 。 因 此 ， 可 将 用 户 而 对 于 需 许可 的 传感器 则 需要 用 户 一 个 明确 的 授权 ， 以 确保 
在 每 两 步 间 的 停留 时 间 和 跨 步 频率 作为 区 分 上 行 与 下 行 的 数 应 用 程序 可 以 正确 的 访问 一 个 特定 的 文件 。 用 户 授权 信息 会 
据 特 征 ， 同 时 由 于 上 行 时 重力 做 负 功 ， 所 以 Z 轴 方 向 的 数值 在 系统 清单 中 具体 声明 ,一 旦 用 户 在 安装 程序 之 初 选择 接受 ， 
一 般 情况 下 小 于 9.81， 下 行 时 重力 做 正 功 ， 所 以 Z 轴 方 向 大 后 期 即使 在 没有 其 他 明确 许可 的 情况 下 该 应 用 程序 也 可 以 直 
T 9.81, 因此 Z 轴 加 速度 数值 与 9.81 的 差 值 正 负 也 可 作为 区 灾 访 问 其 他 无 许可 传感器 。 同 时 Android 系统 传感器 框架 可 
分 下 行 与 下 行 的 数据 特征 。 通 过 观察 多 组 样本 ,发 现 了 轴 上 用 来 访问 设备 的 内 置 传感器 ， 并 提供 了 有 助 于 完成 数据 采集 
的 加 速度 数据 在 下 行 时 的 图 像 曲线 波动 频率 明显 比 上 行 要 工作 的 接口 ,这 些 接口 可 用 于 在 采集 中 确定 内 置 传感器 种 类 ， 
快 ， 因 此 采用 频率 即 极 大 值 和 极 小 值 的 时 间 间 隔 作为 上 行 与 并 在 注册 和 注销 传感器 权限 时 执行 监听 。 
下 行 的 区 分 特征 值 ， 并 对 频率 求 均值 以 完整 刻画 平均 跨 步 频 3.2 实验 及 结果 分 析 
率 。 为 实现 数据 普遍 性 和 代表 性 ， 志 愿 者 选 自 于 不 同年 龄 、 
这 部 分 实现 的 具体 过 程 分 为 三 步 : 首先 需要 遍历 数据 样 不 同 身高 、 不 同性 别 和 不 同 职业 。 每 项 行为 均 有 250 组 数据 ， 
本 并 分 割 周期 得 到 极 大 值 对 应 的 时 间 数 组 与 极 小 值 对 应 的 时 共计 1500 组 数据 样本 ， 每 个 样本 的 时 间 长 度 约 为 5 s。 对 于 
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虽 集 中 的 80% 完 全 正 向 分 


类 后 的 数据 为 训练 所 用 ， 其 余 20% 数 据 混合 后 进行 模型 测试 


(共计 300 组 测试 样本 ) 。 
1000 Hz， 按 每 秒 15 MAr 
段 的 3 s 形成 一 组 
腰 间 , 旦 实验 和 测试 数 扩 


p 


志愿 者 在 进行 指定 
考虑 到 可 能 会 出 现 


ELK RNY 


进行 测试 得 到 准 


实验 测试 结果 妇 


相同 ， 综 合 准确 率 民 


为 站 立 ， 静 止 3 为 多 


实验 识别 准确 率 


Table 1 Experimental identification accuracy 


]J=# note3 
现象 ， 将 数据 集 进 行 4 次 
居 是 完全 随机 选取 的 ， 分 别 


在 实验 中 传感器 的 取样 频率 为 
居 点 形成 向 量 ， 每 组 数据 取 平 稳 阶 
。 采 和 集 数据 时 将 屏幕 朝 前 竖 直 固定 于 
居 在 采集 时 行为 明确 且 严 
行为 时 均 统一 使 
过 拟 合 和 欠 拟 合 
| 练 数据 与 测试 数据 


格 控制 变量 


智能 手机 。 


[X 1 所 示 。 在 本 实验 认为 六 种 行为 权重 
侍 确 率 。( 其 中 静止 1 为 躺 ， 静 止 2 


1% 
1% 


静止 1 静止 2 静止 3 ”步行 LbfT 下行 综合 
1 100 96.4 98.0 96.0 95.6 974 
2 100 97.6 96.8 95.6 96.4 97.6 
3 100 97.2 97.6 96.8 96.0 979 
4 100 96.0 96.8 964 95.6 973 


方法 与 决策 树 相 结合 的 方法 也 有 明显 优势 。 
文献 [15] 中 主要 利用 稀 玻 局 部 保持 投影 法 (sparse local 
preserving projection，SpLPP) 与 随机 森林 集合 使 用 的 方法 ， 
并 与 随机 场 驱 动 的 Ising 模型 ( 即 RFIM) 的 结果 进行 比 对 ， 识 
别 准确 度 结果 如 表 3 所 示 。 
表 3 实验 结果 比 对 


Table 3 Comparison of experimental results 


方法 总 体 准 确 度 
PCA+SVMI[14] 96.2% 
SpLPP+RF[15] 97.4% 
LPP+RF[15] 96.6% 
RFIM+RF[15] 91.2% 
PCA+RF[15] 91.4% 
PCA+DT( 本 文 ) 97.5% 


其 中 该 方法 对 于 水 平静 止 可 达到 100% 的 识别 率 ， 屏 幕 朝 向 
对 于 该 行为 的 判断 准确 有 效 ; 对 站 立 和 坐 的 识别 效果 也 较 好 ， 
后 者 会 导致 手书 ] ， 使 得 陀螺 仪 数据 发 生变 化 ， 从 而 
加 入 陀螺 仪 数 的 识别 准确 率 明 显 有 所 提高 ;其 次 对 


步行 的 识别 率 也 很 可 
行 与 下 行 较 难 区 分 ， 识 别 准 


有 有 一 定 的 可 行 


进 过 四 次 训练 后 ， 实 验 在 测试 数据 集 对 六 种 行为 的 识别 


平均 准确 率 约 为 97.5%， 说 日 性 和 实现 意义 。 


文献 [15] 中 稀 疏 局 部 保持 投影 法 与 随机 森林 结合 使 用 比 
主 成 分 分 析 与 随机 森林 结合 使 用 更 有 优势 ， 但 从 识别 准确 度 
上 来 看 与 本 实验 识别 结果 无 明显 区 别 。 随 机 森林 既是 多 个 决 
策 树 随 机 建立 的 森林 ， 且 每 一 个 决策 树 之 间 没 有 关联 ， 对 于 
单 决 策 树 就 可 解决 的 基础 行为 识别 问题 而 言 无 疑 在 未 改善 结 
果 的 情况 下 造成 了 严重 的 资源 浪费 ， 故 对 于 智能 手机 环境 下 
的 资源 开销 而 言 本 实验 的 设计 更 合理 。 根 据 上 述 比 较 结果 可 
见 本 文 所 提出 的 方法 相 比 己 有 相似 研究 在 方法 和 应 用 适用 性 
上 有 所 改善 ， 对 基础 行为 的 识别 准确 率 上 也 有 所 提高 。 

综合 来 看 ， 对 六 种 基础 行为 的 综合 识别 准确 率 较 理 想 ， 


达到 97.3% 


为 进一步 分 析 实 验 识 别 
种 行为 识别 中 具体 出 现 的 偏 


过 程 中 可 


的 平均 准确 率 ; 对 于 上 
E 确 率 大 概 在 96% 左 右 。 
能 存在 的 缺陷 ， 掌 握 每 


差 ， 将 综合 识别 效果 最 好 的 第 三 


组 实验 的 识别 初始 内 容 与 结果 单独 列 出 进行 逐 项 分 析 ， 具 体 


识别 内 容 如 表 2 所 示 。 


第 三 组 实验 具体 识别 


内 容 


Table 2 Third group identified specific content 


静止 1 静止 3 步行 ” 上行” 下行 
静止 1 250 0 0 0 0 
静止 2 0 7 0 0 0 
静止 3 0 243 0 0 0 
步行 0 0 244 0 3 
上 行 0 0 2 242 7 
下 行 0 0 4 8 240 
测试 时 每 项 行为 均 有 250 组 数据 ， 由 上 表 可 见 在 识别 时 
站 与 坐 两 种 行为 易 发 生 混淆 ， 除 数据 特征 在 选择 上 存在 不 足 


和 实验 误差 多 


率 和 陀螺 仪 敏感 度 的 影响 ， 


定 程度 上 受 该 型 号 智 


GG 


仪 型 号 对 最 终结 果 有 
是 实验 中 最 难 区 分 的 行为 ， 其 中 上 行 


定 改 善 作用 ; 


改进 ， 应 继续 寻找 效果 


对 比方 法 相似 的 已 有 研究 ， 
dp. (UB SUUS Df 


I 


好 的 数据 特征 。 
文献 [14] 中 识别 的 测试 结果 
可 能 出 现 的 数据 过 拟 合 现象 


手机 的 陀螺 仪 采 样 频 


进行 处 理 ， 最 终 得 到 的 结果 有 
与 支持 向 量 机 分 类 器 的 方法 与 本 文 实验 测试 结果 相 比 在 上 


待考 察 。 


— 


J、 下 行 和 步行 三 个 行为 上 


其 中 利用 主 成 分 分 析 


调整 数据 采集 频率 并 使 用 的 陀螺 
同时 步行 、 
F 行 的 识别 效果 有 待 


上 行 、 下 行 


的 效果 相差 不 多 ， 但 对 于 站 立 与 


D 


的 准确 率 比 本 实验 低 较 多 ， 实 验 整体 识别 ; 
而 对 比 使 用 其 他 方法 进行 基础 行为 识别 的 


侍 确 率 也 较 低 。 


， 主 成 分 分 析 


与 已 有 研究 成 果 相 比 提 高 了 准确 性 并 降低 了 复杂 程度 ， 达 到 
预期 目的 并 证 明了 所 提出 方法 的 有 效 性 ， 为 后 续 实 验 增加 
行为 数量 和 行为 内 容 的 优化 芙 定 了 基础 ， 同 时 对 复杂 行为 的 
识别 和 分 析 相 关 研 究 提供 了 运算 时 间 和 程序 结构 的 参考 ， 在 
空间 开销 的 上 也 有 一 定 的 借鉴 作用 。 


4 ”结束 语 


本 文通 过 利用 智能 手机 内 置 加 速度 传感器 和 陀螺 仪 的 三 
轴 数 据 ， 采 用 主 成 分 分 析 与 人 工 筛选 相 结合 的 方法 对 多 种 人 
征 值 进行 提取 ， 选 用 决策 树 与 支持 向 量 机 分 类 器 结合 使 用 的 
多 分 类 方法 ， 在 决策 树 的 各 节点 处 训练 支持 向 量 机 ， 建 立 基 
于 智能 手机 加 速度 传感器 的 用 户 行为 识别 方法 。 经 实验 测 识 
别 准确 率 在 96% 左 右 ， 总 体 来 说 验证 了 所 提出 方法 的 有 效 性 
和 可 行 性 ， 为 智能 手机 实现 健康 监测 、 时 间 管 理 、 信 息 筛 选 
等 黄 定 了 基础 。 

随 着 现代 科技 的 不 断 发 展 ， 人 类 行为 识别 的 研究 从 大 型 
设备 逐步 转向 小 型 化 , 为 行为 识别 寻找 更 加 方便 的 应 用 途径 。 
在 智能 手机 普及 的 今天 ， 手 机 不 止 是 通信 工具 而 是 具有 综合 
功能 的 便携 式 电子 设备 ， 独立 操作 系统 和 运行 空间 可 实 
现 多 种 多 样 的 功能 ， 这 意味 着 智能 手机 可 以 获取 、 利 用 、 提 
供 的 数据 会 越 来 越 多 。 在 未 来 的 发 展 中 ， 智 能 手机 中 可 和 集成 
的 传感器 种 类 会 不 断 增多 ， 传 感 器 硬件 的 更 新 优化 速度 也 会 
不 断 加 快 ， 这 无 疑 将 为 行为 识别 研究 提供 了 更 加 便利 的 条 件 
和 思路 。 
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